فهرست مطالب

نشریه علوم و فنون نقشه برداری
سال سیزدهم شماره 1 (پیاپی 49، تابستان 1402)

  • تاریخ انتشار: 1402/09/12
  • تعداد عناوین: 7
|
  • شیدا چمنکار، یزدان عامریان* صفحات 1-12

    مقدار بخار آب قابل بارش (PWV) یکی از مهم ترین داده ها در بسیاری از مطالعات هواشناسی است. این مولفه دارای تغییرات مکانی و زمانی بالایی است، امروزه استفاده از مشاهدات سیستم های ماهواره ای ناوبری جهانی (GNSS) یکی از روش های بهبود دقت برآورد پارامتر بخارآب است. امواج ارسالی از ماهواره های GNSS با عبور از لایه تروپسفر دچار تاخیر می شوند. تاخیر تروپسفری به دو بخش خشک و تر تقسیم می شوند که بخش تر به تغییرات بخار آب وابسته است. در این مقاله روش های درونیابی بر پایه توابع پایه شعاعی با کرنل اسپیلاین صفحه نازک سه بعدی، شبکه عصبی مصنوعی از نوع پرسپترون، کریجینگ و عکس مجذور فاصله مورد ارزیابی قرار گرفته است. منطقه ای واقع در آمریکای شمالی شامل 26 ایستگاه سیستم تعیین موقعیت جهانی (GPS) مورد مطالعه قرار گرفته و مقادیر بخار آب قابل بارش در دو روز زمستان و تابستان با استفاده از این داده ها به روش های فوق الذکر ارزیابی شده است. مقدار ریشه میانگین مربع خطا (RMSE) با استفاده از روش اسپیلاین صفحه نازک سه بعدی برای دو روز زمستان و تابستان به ترتیب برابر 6/0 و 62/1 میلیمتر بدست آمده است، که در مقایسه با سایر روش ها دارای کمترین مقدار RMSE و در نتیجه دقت بالاتری درهر دو روز می باشد. در نهایت با استفاده از روش درونیابی اسپیلاین صفحه نازک سه بعدی نقشه متراکم از تغییرات بخار آب لایه تروپسفر در منطقه مورد مطالعه تهیه شده است که می تواند بر پیش بینی وضعیت جوی و برآورد میزان بارش تاثیر گذار باشد.

    کلیدواژگان: بخار آب قابل بارش، سیستم تعیین موقعیت جهانی، اسپلاین صفحه نازک، شبکه عصبی مصنوعی، کریجینگ، عکس مجذور فاصله
  • محمد پارسائی، سعید نیازمردی*، علی اسماعیلی گازکهنی صفحات 13-26

    امروزه استخراج ساختمان یکی از مهم ترین نیاز‎های برنامه ریزی برای محیط های شهری و روستایی است. استخراج ساختمان ها از تصاویر سنجش از دوری به دلیل سرعت بالا و هزینه پایین تهیه و پردازش این نوع از داده به مهمترین داده مورد استفاده در این حوزه تبدیل شده است. از بین روش های زیادی که برای استخراج ساختمان وجود دارد، شبکه های عصبی عمیق بیشتر مورد توجه محققین قرار گرفته اند. اما این شبکه ها دارای ضعف هایی نیز هستند. اکثر مدل های موجود، در استخراج چند مقیاسی ساختمان عملکرد ضعیفی دارند. بدین معنا که شبکه ها توانایی استخراج ساختمان هایی با اندازه های مختلف را ندارند. از این رو، در این تحقیق، مدلی برای استخراج چند مقیاسی ساختمان طراحی و ارایه شده است. مدل پیشنهادی، چالش استخراج چند مقیاسی ساختمان را با استفاده از یک ماژول بهبود نتیجه رفع کرده است. ماژول طراحی شده با استفاده از پیچش گسترش یافته زمینه دریافت اطلاعات را افزایش می دهد که باعث می شود ناپیوستگی در خروجی ساختمان های بزرگ پدیدار نشود. استخراج صحیح ساختمان های بزرگ توسط ماژول بهبود و ساختمان های کوچک و متوسط توسط بدنه اصلی، مدل پیشنهادی را به یک مدل کارآمد تبدیل کرده است. برای بررسی عملکرد مدل پیشنهادی، از دو مجموعه داده Massachusetts و WHU استفاده شده است. با آزمایش این دو مجموعه، مدل پیشنهادی با کسب مقادیر 6495/0 و 8572/0 برای معیار IoU بهترین عملکرد را در مقایسه با مدل‎های FCN، U-Net، USPP و DeepLabV3+ نشان داد. بررسی عملکرد ماژول بهبود نشان داد که پس از اضافه کردن این ماژول، مدل پیشنهادی در معیار IoU به میزان 1077/0 عملکرد بهتری نسبت به مدل بدون ماژول نشان می دهد. نتایج همچنین نشان داد که مدل پیشنهادی در استخراج ساختمان های بزرگ، برتری قابل توجهی نسبت به سایر مدل ها دارد که نشان از عملکرد موفق ماژول طراحی شده است.

    کلیدواژگان: استخراج ساختمان، تصاویر سنجش از دوری، یادگیری عمیق، پردازش چند مقیاسی
  • میثم عفتی*، امین زارعی کریانی صفحات 27-44

    برابر آمار و پژوهش های صورت گرفته موتورسیکلت سواران به عنوان یکی از پرخطرترین کاربران حمل ونقل شناخته شده اند. بااین وجود باتوجه به شرایط اقتصادی جامعه و معضلات ترافیکی در شهرها، استفاده از موتورسیکلت همواره مورد استقبال اقشار مختلف جامعه برای جابه جایی درون شهری بوده است. هدف اصلی این پژوهش ارایه روشی مبتنی بر تحلیل های زمانی و توابع خوشه ای سیستم اطلاعات مکانی (GIS) به منظور تحلیل آماری، مکانمند و زمانمند تصادفات موتورسیکلت جهت شناسایی مقاطع پرتصادف و ارایه راهکارهای ایمنی لازم به منظور کاهش تصادفات آتی است. در این راستا با استفاده از توابع کومپ، الگوی مکانی- زمانی تصادفات موتورسیکلت با تاکید بر ساعت وقوع و فصل در منطقه موردمطالعه بررسی شده است و به کمک ارزیابی همبستگی، تاثیر پارامتر زمان در ساعات مختلف شبانه روز و فصول مختلف سال بر تغییرات در فراوانی و پراکنش مکانی تصادفات تحلیل شده است. بر اساس نتایج مشخص شد که بیشترین تعداد تصادفات موتورسیکلت در بازه زمانی 12 ظهر تا 16 بعدازظهر (10/27 درصد تصادفات)، رخ داده است و همچنین با وقوع 53/33 درصد از تصادفات در فصل پاییز، این فصل بیشترین میزان تصادفات را در تمام فصول به خود اختصاص داده است. همچنین با بررسی خوشه ای زمانمند تصادفات در ساعات مختلف شبانه روز و فصول مختلف سال، در قطعه ای از خیابان شریعتی، در بازه زمانی 20 الی24 و در فصل بهار به ترتیب با میزان 012/0 و 02/0 بیشترین تراکم تصادفات را به خود اختصاص داد. نتایج تحقیق نشان داد که بهره گیری تلفیقی از تحلیل های خوشه ای مکانمند و زمانمند مبتنی بر کومپ با شناسایی مقاطع پرتصادف و تراکم تصادفات در معابر شهری و بازه های زمانی  موثر فصلی و ساعتی می تواند در تدوین رویکردهای ایمنی مرتبط با موتورسیکلت سواران منجر به اخذ تصمیمات اصلاحی مرتبط با مکان و زمان شود.

    کلیدواژگان: ایمنی معابر درون شهری، داده کاوی مکانی، تصادفات موتورسیکلت، تراکم کرنل، تحلیل مکانمند
  • مهین جعفری*، زهرا موسوی، عبدالرضا قدس صفحات 45-54

    برای مطالعه خطرپذیری زمین لرزه ها، دستیابی به تخمینی از ویژگی های گسل های فعال مانند پارامترهای هندسی گسل و توزیع لغزش از اهمیت بسزایی برخوردار است. گسیختگی ناشی از زمین لرزه منجر به تغییر شکل و جابه جایی در سطح زمین می شود؛ در 23 فوریه سال 2020 دو زمین لرزه به فاصله 10 ساعت در مرز ایران و ترکیه به وقوع پیوست. زمین لرزه اول با بزرگای Mw 8/5 در ساعت 05:52 به وقت جهانی با سازوکار نرمال و زمین لرزه دوم با بزرگای Mw 0/6 در ساعت 16:00 به وقت جهانی با سازوکار امتدادلغز رخ دادند. در این پژوهش جهت شناسایی گسل مسبب زمین لرزه از مشاهدات حاصل از تکنیک تداخل سنجی راداری استفاده شده است. به منظور تعیین پارامترهای چشمه زمین لرزه از مدل تحلیلی اکادا (1985) استفاده شده است. در مرحله اول مدل سازی مستقیم جهت تعیین پارامترهای هندسی گسل با توزیع لغزش یکنواخت برآورد گردید. نتایج به دست آمده از مدل سازی زمین لرزه دوم، نشان دهنده یک گسل امتدادلغز چپ بر با مولفه نرمال با راستای 24 درجه و شیب 86 درجه است. در مرحله دوم با ثابت در نظر گرفتن پارامترهای هندسی گسل که در مرحله اول تخمین زده شده اند، توزیع لغزش بر روی صفحه گسل محاسبه گردید. با توجه به توزیع لغزش محاسبه شده، بیشترین گسیختگی در عمق 3 کیلومتری و مقدار لغزش 8±97 سانتی متر است. همچنین، با استفاده از پارامترهای تخمین زده شده، بزرگای گشتاوری زمین لرزه دوم Mw 6.05 به دست آمد.

    کلیدواژگان: مدل سازی، اینسار، پارامترهای گسل، زمین لرزه قطور، توزیع لغزش، مدل تحلیلی اکادا
  • یگانه حسن زاده، عباس کیانی*، نیما فرهادی صفحات 55-68

    شناسایی تغییرات تصاویر سنجش ازدور دارای نقش مهمی در بسیاری از برنامه های کاربردی مانند بررسی رشد شهرنشینی، نظارت بر تغییرات کاربری زمین، ارزیابی بلایا و آسیب های طبیعی ایفا می کند. در این فرایند هدف، تعیین برچسب تغییر کرده یا نکرده برای پیکسل های دو تصویر می باشد که از یک مکان ولی در دو زمان متفاوت گرفته شده است. همین طور در دهه اخیر استفاده از روش های یادگیری عمیق به دلیل عملکرد مناسبی که در تفسیر و پردازش داده های سنجش ازدوری دارند و همین طور توانایی حذف مهندسی ویژگی و استخراج ویژگی های سطح بالا از تصاویر، موردتوجه بسیاری از محققان این حوزه قرارگرفته است. در همین راستا، در این مقاله یک مدل یادگیری عمیق بهینه طراحی شده است که به دلیل ساختار سلسله مراتبی، طراحی موثر انتقال ویژگی و بهره وری مناسب از ویژگی های چندمقیاسه، دقت شناسایی تغییرات تصاویر دو زمانه را افزایش می دهد. مدل پیشنهادی به دلیل ساختار و معماری بهینه نسبت به برخی مدل های مشهور موجود مانند BIT از سرعت و دقت نتایج بالاتری برخوردار است. نتایج به دست آمده از اعمال مدل پیشنهادی بر روی دو مجموعه داده ی مورد بررسی، نسبت به روش مقایسه ای BIT به طور میانگین حاکی از دقت کلی حدود 96 درصد و کاهش 10 درصدی میزان محاسبات ضرب و جمع می باشد.

    کلیدواژگان: شناسایی تغییرات، سنجش از دور، یادگیری عمیق، تصاویر دو زمانه، شبکه های عصبی دوجریانه
  • میلاد جمالی، علی اصغر آل شیخ، محمد شریف* صفحات 69-81

    با رشد روزافزون فناوری های تعیین موقعیت و استفاده از سامانه های ناوبری، امروزه حجم وسیعی از داده های حرکتی اشیاء متحرک مانند افراد، خودروها، کشتی ها و حیوانات در اختیار می باشد. با این وجود عدم تمامیت و ناقص بودن این داده ها به دلایل دستگاهی، انسانی و محیطی، تجزیه وتحلیل خطوط سیر و بکارگیری موثر آن ها را در زمینه های مختلف به چالش می کشد. از اینرو بازتولید داده های از دست رفته نقش مهمی در استفاده حداکثری از ظرفیت داده های حرکتی بویژه در حوزه ناوبری و ردیابی مسیر دارد. در این پژوهش با بهره گیری از روش اندازه گیری تشابه خطوط سیر اشیاء، به بازسازی خطوط سیر حاوی گپ پرداخته شده است. در این راستا از روش پیچش زمانی پویا زمینه-مبنا (CDTW) به همراه پارامترهای حرکتی سرعت و جهت برای اندازه گیری شباهت و بازسازی خطوط سیر کشتی ها در دو منطقه از اقیانوس اطلس و آرام استفاده شده است. دو سازوکار استفاده از تعداد خطوط سیر مشابه مشخص و تعداد خطوط سیر از حد آستانه مشخص برای بازسازی درنظر گرفته شده است. نتایج نشان دهنده آن است که استفاده از تعداد خطوط سیر مشابه مشخص در مقایسه با تعریف حد آستانه، باعث کاهش خطای مجذور میانگین مربعات و میانگین مطلق از 5/1 و 4/1 به 5/0 و 4/0 می شود. همچنین افزایش طول خطوط سیر باعث بهبود مقادیر مجذور میانگین مربعات و میانگین مطلق از 5/0 به 1/0 در حالت تعداد خط سیر مشخص و 5/1 به 3/0 در حالت حد آستانه شده است.

    کلیدواژگان: خط سیر، گپ، اندازه گیری تشابه، داده از دست رفته، سامانه شناسایی خودکار (AIS)
  • آیدین ابراهیمی*، امیررضا گروسی، علی حسینی نوه، علی محمدزاده صفحات 83-97

    تشخیص اجسام کوچک مانند خودرو و استخرها در تصاویر پهپادی با توان تفکیک مکانی بالا، به دلیل ویژگی های هندسی و رنگ مشابه آن ها، با چالش هایی روبرو است. افزایش تعداد خودروها نه تنها از منظر ترافیک شهری یک چالش مهم محسوب می گردد بلکه منجر به مشکلات زیست محیطی نظیر آلودگی و گرم شدن هوا نیز می گردد؛ از این رو، پایش این اهداف می تواند نقشی مهم در مدیریت این مشکلات داشته باشد. از طرفی، ساخت و نگهداری استخرهای آبی نیز به مقدار قابل توجهی آب نیاز دارد و پایش این اهداف در محیط های شهری برای صرفه جویی در مصرف آب ضروری است. در این راستا، تصاویر سنجش ازدور پهپادی و شبکه های یادگیری عمیق که توانایی بالایی در شناسایی اشیاء از این تصاویر را دارند، ابزاری مناسب برای پایش این اهداف محسوب می شوند. اگرچه تاکنون پژوهش های ارزشمندی در این زمینه برای مقابله با هریک از چالش های محیط زیستی مطرح شده صورت گرفته است، اما همچنان کاستی هایی در آن ها وجود دارد. در این مطالعه، یک شبکه یادگیری عمیق جدید YOLOv5+ برای شناسایی دو هدف خود رو و استخر آبی از تصاویر پهپادی توسعه داده شده است، بطوری که در آن عملکرد شبکه در استخراج ویژگی های کارآمد به دلیل بکارگیری مکانیسم Inception در لایه های میانی تقویت شده است. همچنین، در این تحقیق، از داده های پهپادی مرجع DJI Mavic و DJI Mini Se که از مناطق تیانجین در کشور چین و کان در کشور فرانسه اخذ شده اند، برای ارزیابی عملکرد شبکه پیشنهادی و مقایسه آن با شبکه های یادگیری عمیق YOLOv5 و YOLOv7 استفاده گردید. در نهایت، نتایج نشان داد شبکه پیشنهادی با دقت کلی 95%، بطور میانگین عملکرد شبکه های قیاسی را 2 درصد بهبود بخشیده است که نشان دهنده کارایی رویکرد پیشنهادی در این تحقیق است.

    کلیدواژگان: یادگیری عمیق، تصاویر سنجش ازدور ماهواره ای، تشخیص خودرو، استخر، قدرت تفکیک مکانی بالا، شبکه های عصبی پیچشی
|
  • Sheida Chamankar, Yazdan Amerian* Pages 1-12

    Precipitable water vapor (PWV) is one of the most important data in meteorological studies. This component has high spatial and temporal changes, today the use of global navigation satellite systems (GNSS) observations is one of the ways to improve the accuracy of water vapor parameter estimation. The waves sent from GNSS satellites are delayed when passing through the troposphere layer. The troposphere delay is divided into two parts, dry and wet, and the wet part depends on changes in water vapor. In this article, the interpolation methods based on radial basis functions with 3D thin plate spline kernel, artificial neural network of perceptron type, kriging and inverse distance weighted have been evaluated. A region located in North America including 26 Global Positioning System (GPS) stations has been studied and the amounts of precipitable water vapor on two days in winter and summer have been evaluated using these data in the aforementioned methods. The value of the root mean square error (RMSE) using the 3D thin plate spline method for two days in winter and summer has been obtained as 0.6 and 1.62 mm, respectively, which has the lowest RMSE value compared to other methods. And as a result, there is a higher accuracy in both days. Finally, by using 3D thin plate spline interpolation method, a dense map of water vapor changes in the troposphere layer in the study area has been prepared, which can have an impact on forecasting the weather and estimating the amount of precipitation

    Keywords: precipitable water vapor, GPS, thin plate spline, artificial neural network, kriging, inverse distance weighted
  • Mohammad Parsaei, Saeid Niazmardi*, Ali Esmaeily Pages 13-26

    Building extraction is one of the most crucial requirements of urban planning. Due to their availability and affordable cast, high-resolution remotely sensed images are often used for building extraction. Owing to their impressive performances, Deep learning techniques have attracted the attention of researchers for building extraction from high-resolution images. Nevertheless, most existing models perform poorly in recovering spatial details and discriminating buildings with various sizes and shapes. Hence, this paper proposes an improvement module to address the problems associated with multi-scale building extraction. The proposed module uses dilated convolutions to increase the receiving information area to reduce the discontinuities in the results of large buildings. Extracting large buildings using the proposed module and small buildings using the main architecture of the network has turned the proposed network into an effective method for building extraction. The results of the experiments showed that the proposed module with the IoU of 0.6495 and 0.8572 for Massachusetts and WHU data sets outperformed FCN, U-Net, USSP, and DeepLab V3+. The performance analysis of the proposed module also showed that this module was able to improve the performance of building extraction considering the IoU metric by 0.1077.

    Keywords: Building extraction, neural networks, remote sensing images, deep learning, multi-scale analysis
  • Meysam Effati*, Amin Zarei Karyani Pages 27-44

    Motorcycle riders are one of the most dangerous transport users in the occurrence of crashes. According to economic conditions and traffic problems people are persuasion to use motorcycle for intra city transportation. The major purpose of this research is to present a method based on temporal analysis and cluster functions of the Geographical Information System (GIS) in order to analyze the statistical, spatial and temporal aspects of motorcycle crashes in order to identify roadway crash prone sections and provide necessary safety solutions. For this purpose, using Comap  and Geospatial functions, spatio-temporal patterns of motorcycle crashes and effect of the hourly and seasonal time on the location of crashes has been  investigated. According to the results of the research, it was found that the highest number of motorcycle crashes occur between 12:00 and 4:00 pm. In addition, The results showed that the highest number of motorcycle crashed happened in the fall and Also, the highest density of accidents is related to segments of Takhti Street. The results showed that using spatial cluster and temporal analysis is useful for identification of r roadway crash prone sections as well as the determination of the effective seasonal and hourly effects on crash clusters to perform adequate safety solutions related to motorcycles and apply preventively decisions based on the location and time of crashes.

    Keywords: safety, Urban Roads, Motorcycle crashes, kernel Density, Spatial analysis
  • Mahin Jafari*, Zahra Mousavi, Abdolreza Ghods Pages 45-54

    The Ghotor doublet earthquake happened on 23 Feb 2020 near Khoy and Salmas cities in west Azerbaijan province of Iran near Iran-Turkey border .The first large event with a magnitude of 5.8 Mww (USGS) happened at 5:52 UTC (9:23 AM local time) and followed by a second large event of magnitude 6.0 Mw (USGS) at 16:00 UTC. The second event inflicted most of the building damages. No surface rupture has been reported for the events. We estimated the areal extent of the surface displacement related to the 2020 Ghotor doublet earthquakes using three sets of C-band imagery from the European Space Agency Sentinel 1A and 1B satellites. Due to small ground displacement, we could not model the fault geometry of the first mainshock. The ascending and descending displacement maps of the second main shock are used to jointly invert the causative fault plane parameters. To obtain the source parameters, we first down-sampled the unwrapped LOS surface displacements by a quadtree algorithm and then inverted the unwrapped interferograms to infer the geometry of a single rectangular plane with uniform slip in a uniform elastic half-space. The fault geometry parameters are location (X, Y, and Depth), size (length and width), orientation (strike, dip, and rake), and uniform slip of the rupture plane. We assume the X, Y, and depth to correspond to the center of the top edge of the rupture plane. We used a nonlinear inversion method as implemented in the open-source software called Geodetic Bayesian Inversion Software (GBIS) released by Centre for Observation and Modeling of Earthquakes, Volcanoes, and Tectonics (COMET). We used Okada‘s (1985) displacement green functions to model the displacement field. The calculated optimal model illustrates a northeast-striking (N24°) left-lateral rupture plane dipping ~86° towards the west. Once the geometry of the fault plane with uniform slip was estimated, we expanded the rupture plane 20 km along-strike and 12 km along down-dip directions and divided it into 1291 individual patches to obtain the distributed slip on the rupture plane. Each patch has a fixed geometry according to optimal source parameters obtained from the nonlinear modeling, and the slip was allowed to vary freely on the fault plane. We used a modified version of the open-source software called FaultResampler 1.4 to apply the linear inversion for calculating slip distribution on the rupture plane. The coseismic rupture concentrates around a center depth of 3 km with a maximum slip of 97±8  cm. Assuming a rigidity modulus of 30 GPa, the geodetic moment is estimated to be 1.517E+18 Nm, equivalent to a moment magnitude of 6.05 Mw.

    Keywords: Ghotor earthquake, fault parameter, InSAR, slip distribution, Okada
  • Yeganeh Hasanzadeh, Abbas Kiani*, Nima Farhadi Pages 55-68

    Identification of changes in remote sensing images plays an important role in many applications, such as monitoring the growth of urbanization, land use changes, and assessing disasters and natural damages. This process aims to assign the label "changed" or "not changed" to the pixels of two images taken from the same place but at two different times. On the other hand, in the last decade, deep learning methods have attracted the attention of many researchers in this field due to their proper performance in interpreting and processing remote sensing data and the ability to remove feature engineering and extract high-level features from images. In this regard, in this article, an optimal deep learning model has been designed, which increases the accuracy of identifying changes in two-time images due to its hierarchical structure, appropriate efficiency of multiscale features, and effective design of feature transfer. Due to the optimal structure and architecture, the proposed model has higher speed and accuracy of results compared to some popular models such as BIT. Applying the proposed model to the two data sets under investigation indicates an average accuracy of 96% and less complex calculations.

    Keywords: change detection, remote sensing, deep learning, two-time images, two-stream neural networks
  • Milad Jamali, AliAsghar Alesheikh, Mohammad Sharif* Pages 69-81

    With the increasing growth of positioning technologies and the use of navigation systems, a large volume of moving point object data, such as people, cars, ships, and animals, is available. However, the lack of integrity and incompleteness of these data for systemic, human, and environmental reasons challenges the analysis of trajectories and their effective application in various fields. Therefore, the reconstruction of missing data plays an important role in maximizing the capacity of movement data, particularly in navigation and track tracking. In this study, using the similarity measurement of trajectories approach, trajectories containing gaps are reconstructed. In this regard, the context-based dynamic time warping (CDTW) method, along with speed and direction movement parameters, are used to measure the similarity and reconstruct the trajectories of vessels in two regions of the Atlantic and Pacific Oceans. Two mechanisms, a constant number of trajectories and a specified threshold, are considered for reconstruction. The results show that using a constant number of trajectories in comparison with the specified threshold reduces the root mean square error (RMSE) and mean absolute error (MAE) from 1.5 and 1.4 to 0.5 and 0.4, respectively. In addition, increasing the length of the trajectories improves the RMSE and MAE values from 0.5 to 0.1 in the case of a constant number of trajectories and 1.5 to 0.3 in the case of the specified threshold.

    Keywords: Trajectory, Gap, Similarity measurement, Missing data, Automatic Identification System (AIS)
  • Aydin Ebrahimi*, Amirreza Garousi, Ali Hosseini Naveh, Ali Mohammadzadeh Pages 83-97

    Detecting small objects such as vehicles and swimming pools in high-spatial-resolution drone images is challenging due to their similar geometric and color features. The increase in the number of vehicles is not only a major challenge from the perspective of urban traffic but also leads to environmental problems such as pollution and warming. Therefore, monitoring these targets can play an important role in managing these problems. On the other hand, the construction and maintenance of swimming pools also require a significant amount of water, and monitoring these targets in urban environments is essential for water conservation. In this regard, drone remote sensing images and deep learning networks, which have a high ability to detect objects from these images, are considered suitable tools for monitoring these targets. Although valuable research has been done in this area to address each of the environmental challenges mentioned, there are still shortcomings in them. In this study, a new deep learning network YOLOv5+ has been developed to simultaneously detect two targets, vehicles and swimming pools, from drone images, in which the network's performance in extracting efficient features has been enhanced due to the use of the Inception mechanism in the intermediate layers. Additionally, in this study, DJI Mavic and DJI Mini Se drone data from Tianjin regions in China and the city of Cannes in France were used to evaluate the performance of the proposed network and compare it with the YOLOv5 and YOLOv7 deep learning networks. Finally, the results showed that the proposed network achieved an overall accuracy of 95% on the test set, which is an improvement of 2% over the YOLOv5 and YOLOv7 networks, indicating the efficiency of the approach proposed in this study.

    Keywords: Deep learning, satellite remote sensing images, vehicle detection, pool, high spatial resolution, convolutional neural network